临床NLP任务,例如文本的心理健康评估,必须考虑社会限制 - 绩效最大化必须受保证用户数据隐私的最大重要性来限制。消费者保护法规(例如GDPR)通常通过限制数据可用性来处理隐私,例如要求将用户数据限制为给定目的的“必要内容”。在这项工作中,我们认为提供更严格的正式隐私保证,同时增加模型中用户数据量的同时,在大多数情况下,为所有涉及的各方(尤其是对用户)增加了收益。我们在Twitter和Reddit帖子的两个现有自杀风险评估数据集上演示了我们的论点。我们提出了第一个分析并置用户历史记录长度和差异隐私预算,并详细说明建模其他用户上下文如何实现公用事业保存,同时保持可接受的用户隐私保证。
translated by 谷歌翻译
We address the problem of extracting key steps from unlabeled procedural videos, motivated by the potential of Augmented Reality (AR) headsets to revolutionize job training and performance. We decompose the problem into two steps: representation learning and key steps extraction. We employ self-supervised representation learning via a training strategy that adapts off-the-shelf video features using a temporal module. Training implements self-supervised learning losses involving multiple cues such as appearance, motion and pose trajectories extracted from videos to learn generalizable representations. Our method extracts key steps via a tunable algorithm that clusters the representations extracted from procedural videos. We quantitatively evaluate our approach with key step localization and also demonstrate the effectiveness of the extracted representations on related downstream tasks like phase classification. Qualitative results demonstrate that the extracted key steps are meaningful to succinctly represent the procedural tasks.
translated by 谷歌翻译
深度神经网络(DNNS)已被证明在各种应用程序中都成功了,例如语音识别和合成,计算机视觉,机器翻译和游戏播放,仅举几例。但是,现有的深度神经网络模型在计算上是昂贵且内存密集型的,阻碍了其在存储器资源低或具有严格延迟要求的应用程序中的部署。因此,一种自然的想法是在深网中执行模型压缩和加速度,而不会显着降低模型性能,这就是我们所谓的降低复杂性。在以下工作中,我们尝试通过将其知识提炼为基于CNN的模型,从而降低自然语言任务的最新模型状态LSTM模型的复杂性,从而减少测试过程中的推理时间(或延迟)。
translated by 谷歌翻译
我们提出了一种适用于半全球任务的自学学习(SSL)方法,例如对象检测和语义分割。我们通过在训练过程中最大程度地减少像素级局部对比度(LC)损失,代表了同一图像转换版本的相应图像位置之间的局部一致性。可以将LC-LOSS添加到以最小开销的现有自我监督学习方法中。我们使用可可,Pascal VOC和CityScapes数据集评估了两个下游任务的SSL方法 - 对象检测和语义细分。我们的方法的表现优于现有的最新SSL方法可可对象检测的方法1.9%,Pascal VOC检测1.4%,而CityScapes Sementation则为0.6%。
translated by 谷歌翻译
具有注释的缺乏大规模的真实数据集使转移学习视频活动的必要性。我们的目标是为少数行动分类开发几次拍摄转移学习的有效方法。我们利用独立培训的本地视觉提示来学习可以从源域传输的表示,该源域只能使用少数示例来从源域传送到不同的目标域。我们使用的视觉提示包括对象 - 对象交互,手掌和地区内的动作,这些地区是手工位置的函数。我们采用了一个基于元学习的框架,以提取部署的视觉提示的独特和域不变组件。这使得能够在使用不同的场景和动作配置捕获的公共数据集中传输动作分类模型。我们呈现了我们转让学习方法的比较结果,并报告了阶级阶级和数据间数据间际传输的最先进的行动分类方法。
translated by 谷歌翻译